目标:以 Claude Code (CC) 2.1.88 源码为蓝本,针对 DeepSeek Agent Infra / LLM Application 方向岗位,整理所有必须掌握的知识点、现有文档索引和学习优先级。
一、DeepSeek 相关岗位画像(通用要求)
DeepSeek 在 Agent/应用侧的岗位通常要求以下几类能力:
| 能力维度 |
典型要求 |
| LLM 基础 |
理解 Transformer 架构、RLHF、Reasoning 模型训练原理 |
| Agent 框架 |
会设计 Agentic Loop、Tool Use、多 Agent 协作 |
| 工程能力 |
TypeScript/Python 大型项目、异步并发、流式处理 |
| 系统设计 |
高并发连接管理、状态持久化、可中断恢复 |
| 协议 |
MCP(Model Context Protocol)、Streaming SSE/WebSocket |
| 安全 |
权限模型、沙箱隔离、注入防御 |
二、现有文档全索引(按学习优先级)
🔴 第一优先级:Agent 框架核心(必须掌握)
| 文档 |
路径 |
核心内容 |
| 总览与学习路线 |
docs/00-总览与学习路线.md |
CC 整体架构图、技术栈、模块地图 |
| 启动引导与初始化 |
docs/01-启动引导与初始化流程.md |
main.tsx → init() → launchRepl() 启动链 |
| Agentic 查询循环 |
docs/02-Agentic查询循环与QueryEngine.md |
⭐ Agentic Loop 核心,query() / QueryEngine |
| 工具系统 |
docs/03-工具系统Tool-System.md |
⭐ Tool 注册/调度/并行执行机制 |
| 权限与安全系统 |
docs/05-权限与安全系统.md |
⭐ 权限决策树、沙箱模型、Harness 边界 |
| 完整请求处理流水线 |
docs/17-完整请求处理流水线.md |
⭐ 端到端全链路,面试核心材料 |
| 智能化核心机制 |
docs/16-智能化核心机制深度解析.md |
⭐ 上下文压缩、中断恢复、多 Agent |
🟠 第二优先级:工程支撑层
| 文档 |
路径 |
核心内容 |
| API 通信与 Streaming |
docs/08-API通信与Streaming.md |
SSE 流式处理、backpressure、token 计量 |
| 状态管理系统 |
docs/07-状态管理系统.md |
轻量 Store、AppStateStore、发布订阅 |
| 上下文窗口管理 |
docs/10-上下文窗口管理与压缩.md |
压缩策略、SNIP、Token Budget |
| 任务与多 Agent |
docs/11-任务与多Agent系统.md |
Task 编排、SubAgent、协调协议 |
| MCP 协议集成 |
docs/09-MCP协议集成.md |
MCP Client/Server、工具扩展协议 |
| 命令系统 |
docs/04-命令系统Command-System.md |
60+ 斜杠命令注册/路由 |
🟠+ 第二优先级补充:深度专题(新增文档)
| 文档 |
路径 |
核心内容 |
| Swarm 多 Agent 协调 |
docs/20-Swarm多Agent协调系统.md |
TeamFile/Mailbox 协议、权限同步、inProcessRunner |
| SystemPrompt 构建 |
docs/21-SystemPrompt构建与Prompt工程.md |
Section 缓存机制、动态边界、编码约束 |
| Session 管理与恢复 |
docs/22-Session管理与状态恢复.md |
JSONL Transcript、墓碑机制、Worktree Session |
| MemDir 记忆系统 |
docs/23-MemDir自动记忆系统.md |
四类记忆、MEMORY.md、AI 语义检索(findRelevantMemories) |
| Computer Use |
docs/24-ComputerUse桌面自动化系统.md |
Chicago 系统、MCP 集成、截图流水线、坐标系 |
| LSP 集成 |
docs/25-LSP集成与IDE能力.md |
诊断注册表、文件同步、多服务器路由 |
| Plan Mode V2 |
docs/26-PlanModeV2规划模式.md |
5 阶段工作流、探索 Agent、Pewter Ledger 实验 |
| VCR 测试基础设施 |
docs/27-VCR测试基础设施.md |
录制/回放、dehydrate、CI fixture 强制检查 |
🟡 第三优先级:进阶与扩展
| 文档 |
路径 |
核心内容 |
| 终端 UI(React Ink) |
docs/06-终端UI与React-Ink.md |
React → 终端渲染,可选了解 |
| 远程桥接 Bridge |
docs/12-远程桥接Bridge系统.md |
CCR 远程容器、WebSocket 控制平面 |
| 插件与技能系统 |
docs/13-插件与技能系统.md |
技能注册、bundled skill、hook |
| 成本追踪与 Token 管理 |
docs/14-成本追踪与Token管理.md |
计费、Token 追踪 |
| 核心工具函数库 |
docs/15-核心工具函数库.md |
通用 utils |
🟢 第四优先级:系统设计与面试准备
| 文档 |
路径 |
核心内容 |
| 系统设计第一性原理 |
docs/OpenClaw系列/12-SYSTEM_DESIGN_PRINCIPLES.md |
从根本问题出发的架构推导 |
| 面试速查表(原版) |
docs/OpenClaw系列/13-INTERVIEW_CHEATSHEET.md |
⭐ 面试标准答案、追问应对 |
| 面试题全集(新版) |
docs/28-面试题全集与岗位需求.md |
⭐⭐ 200+ 题,覆盖全部28个模块,含代码题 |
| 第一性原理总结 |
docs/OpenClaw系列/11-FIRST_PRINCIPLES_SUMMARY.md |
全套材料导读 |
| OpenClaw 真实项目分析 |
docs/OpenClaw系列/OpenClaw真实项目分析.md |
实战案例分析 |
🔵 LLM 技术深度(理论储备)
| 文档 |
路径 |
核心内容 |
| Transformer 架构深度解析 |
docs/LLM技术深度系列/01-Transformer架构完全深度解析.md |
Attention 数学、KV Cache |
| 大模型预训练 |
docs/LLM技术深度系列/02-大模型预训练技术全景.md |
预训练数据、架构演进 |
| RLHF 完整解析 |
docs/LLM技术深度系列/03-RLHF完整技术解析.md |
PPO、奖励模型 |
| Reasoning 模型训练 |
docs/LLM技术深度系列/05-Reasoning模型训练技术全景.md |
⭐ DeepSeek-R1 相关核心 |
| MoE 稀疏架构 |
docs/LLM技术深度系列/06-MoE稀疏架构深度解析.md |
⭐ DeepSeek-V3/MoE 核心 |
| 长上下文技术 |
docs/LLM技术深度系列/07-长上下文技术完全指南.md |
RoPE、滑动窗口 Attention |
| 顶级模型学习路径 |
docs/19-顶级模型学习路径与资料.md |
资料合集、学习路线 |
三、必须掌握的技能栈
3.1 核心工程技能
TypeScript / Node.js ├── 严格类型系统(泛型、条件类型、infer) ├── 异步编程(async/await、Promise、AsyncGenerator) ├── 流式处理(ReadableStream、SSE、backpressure) ├── Zod 数据校验 └── 模块化架构(依赖注入、工厂模式)
React(用于 React Ink 终端 UI) ├── Hooks(useState/useEffect/useReducer/useSyncExternalStore) ├── 组件生命周期与副作用管理 └── 状态提升与 Context
Bun / 构建工具 ├── bun:bundle 条件编译(feature flags / DCE) └── 打包与单文件分发
|
3.2 Agent 框架设计能力
Agentic Loop 设计 ├── 多轮 LLM 推理循环(stop_reason 判断) ├── Tool Use 协议(tool_use block → 执行 → tool_result) ├── 并行 vs 串行工具调度策略 ├── 中断 / 恢复 / 取消机制(AbortSignal / AbortController) └── 错误重试与降级策略
工具系统(Tool System) ├── Tool 接口定义(inputSchema / execute / permission) ├── 工具注册与发现机制 ├── 权限检查前置拦截(Harness 边界) └── 内置工具:Bash / Read / Write / Edit / Grep / WebFetch 等
多 Agent 协作 ├── SubAgent 派发(AgentTool) ├── 任务编排(Task / coordinator) ├── 跨 Agent 状态共享 └── Swarm / Team 协调协议
|
3.3 安全与权限模型
权限决策树 ├── Allow / Deny / Ask 三态模型 ├── 路径级权限(checkReadPermission / checkWritePermission) ├── 命令级权限(BashTool 白名单/黑名单) ├── Internal Harness Path 豁免机制 └── 用户交互确认(permission prompt)
沙箱与隔离 ├── 环境变量过滤(allowedEnvVars 白名单) ├── 文件系统边界(working directory 限制) └── 远程容器隔离(CCR / Docker)
|
3.4 LLM 接入与流式处理
Anthropic SDK / OpenAI-compatible API ├── Streaming API(stream() → AsyncIterable<Event>) ├── Tool Use 消息格式(content blocks) ├── Token 计量与 Cost 追踪 ├── System Prompt 构建与管理 └── 上下文窗口压缩(Snip / Compact 策略)
MCP(Model Context Protocol) ├── MCP Server 实现(工具/资源/提示) ├── MCP Client 连接管理 ├── stdio / SSE transport └── 动态工具扩展
|
3.5 系统设计能力
高并发连接管理 ├── 事件驱动模型(C10K) ├── WebSocket 连接生命周期 └── 连接状态机设计
状态存储分层 ├── L1 内存缓存(进程内) ├── L2 Redis(分布式缓存) └── L3 数据库持久化
流式响应 ├── SSE / WebSocket 推送 ├── Streaming token 聚合 └── 客户端 backpressure 处理
可中断 Agent ├── AbortController 传播链 ├── 检查点状态保存 └── 恢复机制设计
|
3.6 LLM 理论基础(对 DeepSeek 尤其重要)
Transformer 架构 ├── Multi-Head Self-Attention(数学推导) ├── KV Cache 机制与内存优化 ├── RoPE 位置编码 └── FlashAttention 原理
训练方法 ├── 预训练(Next Token Prediction) ├── SFT(Supervised Fine-Tuning) ├── RLHF / PPO / GRPO └── ⭐ Reasoning 模型(DeepSeek-R1 / Chain-of-Thought 强化)
架构创新(DeepSeek 特色) ├── ⭐ MoE(Mixture of Experts)稀疏激活 ├── ⭐ MLA(Multi-head Latent Attention) ├── 长上下文扩展(滑动窗口、YaRN) └── 推理效率优化(投机解码)
|
四、Harness 架构的核心概念速查
这是面试中最常考的「CC Harness」知识点:
┌──────────────────────────────────────────────────────┐ │ HARNESS(Claude Code) │ │ │ │ 用户输入 ──→ 权限预检 ──→ LLM 推理 ──→ 工具执行 │ │ ↑ ↓ │ │ Permission Tool Result │ │ Interceptor (过滤/脱敏后) │ │ ↓ │ │ 送回 LLM(下一轮) │ │ │ │ 关键职责: │ │ 1. 权限门控(Allow/Deny/Ask) │ │ 2. 工具调度(并行/串行/中断) │ │ 3. 输出过滤(hints 剥离、内容安全) │ │ 4. 状态管理(Session、上下文窗口) │ │ 5. 目录保证(ensureMemoryDirExists) │ │ 6. Hooks 执行(settings.json 配置的自动化行为) │ └──────────────────────────────────────────────────────┘
|
面试一句话总结:
“Harness 是 LLM 的执行环境(Runtime),负责权限验证、工具调度、状态管理和安全边界,LLM 只做推理决策,真正的副作用全由 Harness 代为执行和把关。”
五、关键源码文件速查
| 文件 |
作用 |
面试重要度 |
src/query.ts |
Agentic Loop 入口 |
⭐⭐⭐⭐⭐ |
src/QueryEngine.ts |
查询引擎抽象 |
⭐⭐⭐⭐⭐ |
src/Tool.ts |
Tool 基类定义 |
⭐⭐⭐⭐⭐ |
src/tools.ts |
所有工具注册 |
⭐⭐⭐⭐ |
src/Task.ts |
Task / SubAgent |
⭐⭐⭐⭐ |
src/utils/permissions/filesystem.ts |
文件权限决策 |
⭐⭐⭐⭐ |
src/tools/BashTool/bashPermissions.ts |
命令权限决策 |
⭐⭐⭐⭐ |
src/memdir/memdir.ts |
记忆目录管理 |
⭐⭐⭐ |
src/utils/claudeCodeHints.ts |
Hints 侧信道 |
⭐⭐⭐ |
src/entrypoints/cli.tsx |
CLI 入口 |
⭐⭐⭐ |
src/screens/REPL.tsx |
主交互循环 |
⭐⭐⭐⭐ |
src/services/ |
分析/压缩服务 |
⭐⭐⭐ |
src/bridge/bridgeMain.ts |
远程桥接核心 |
⭐⭐ |
六、推荐学习顺序(3-4周计划)
第 1 周:Agent 框架核心
Day 1-2: docs/00 + docs/01 + docs/02(总览 + 启动 + Agentic Loop) Day 3-4: docs/03 + docs/05(工具系统 + 权限安全) Day 5-7: docs/17 + docs/16(流水线 + 智能核心) 配合阅读:src/query.ts, src/Tool.ts, src/tools/BashTool/
|
第 2 周:工程支撑与协议
Day 1-2: docs/08 + docs/10(流式 API + 上下文管理) Day 3-4: docs/09 + docs/11(MCP + 多 Agent) Day 5-7: docs/07 + docs/12(状态管理 + Bridge) 配合阅读:src/services/, src/bridge/, src/tasks/
|
第 3 周:LLM 理论(DeepSeek 特色)
Day 1-2: LLM系列/01(Transformer 深度) Day 3-4: LLM系列/05(Reasoning 模型)—— DeepSeek-R1 核心 Day 5-6: LLM系列/06(MoE 架构)—— DeepSeek-V3 核心 Day 7: LLM系列/07(长上下文)
|
第 4 周:系统设计与面试准备
Day 1-2: OpenClaw系列/12(系统设计第一性原理) Day 3-4: OpenClaw系列/13(面试速查表,背诵核心回答) Day 5-7: 模拟面试 + 查漏补缺
|
七、面试高频问题预测(CC Harness 视角)
设计一个 AI Agent 框架,如何实现工具调用的权限控制?
→ 参考 docs/05-权限与安全系统.md,重点讲 Allow/Deny/Ask 三态 + 路径级权限
如何设计一个可中断、可恢复的 Agentic Loop?
→ 参考 docs/02 + docs/16,重点讲 AbortController 传播链 + 检查点
多个工具并发调用时如何保证安全性和一致性?
→ 参考 docs/03-工具系统.md,重点讲并行执行策略 + 工具间隔离
如何设计 LLM 的上下文窗口管理,防止 token 溢出?
→ 参考 docs/10-上下文窗口管理.md,重点讲 SNIP 压缩 + Token Budget
MCP 协议的设计哲学是什么?如何扩展工具?
→ 参考 docs/09-MCP协议集成.md
DeepSeek-R1 的 Reasoning 训练方式与普通 SFT 有什么区别?
→ 参考 docs/LLM技术深度系列/05-Reasoning模型训练技术全景.md
MoE 稀疏架构相比 Dense 模型的核心优势?
→ 参考 docs/LLM技术深度系列/06-MoE稀疏架构深度解析.md
八、覆盖度评估(2026-05-27 最终版)
已完成文档(28篇)
| 模块 |
文档编号 |
精读深度 |
| 总览与路线 |
00 |
✅ |
| 启动流程 |
01 |
✅ |
| Agentic Loop |
02 |
✅ |
| 工具系统 |
03 |
✅ |
| 命令系统 |
04 |
✅ |
| 权限安全 |
05 |
✅ |
| 终端 UI |
06 |
✅ |
| 状态管理 |
07 |
✅ |
| API/Streaming |
08 |
✅ |
| MCP 集成 |
09 |
✅ |
| 上下文管理 |
10 |
✅ |
| 多 Agent 系统 |
11 |
✅ |
| Bridge 系统 |
12 |
✅ |
| 插件技能系统 |
13 |
✅ |
| 成本追踪 |
14 |
✅ |
| 工具函数库 |
15 |
✅ |
| 智能核心机制 |
16 |
✅ |
| 请求处理流水线 |
17 |
✅ |
| 本地模型部署 |
18 |
✅ |
| 学习路径资料 |
19 |
✅ |
| Swarm 协调系统 |
20 |
✅ 精读14个源文件 |
| SystemPrompt 构建 |
21 |
✅ 精读 prompts.ts 915行 |
| Session 管理恢复 |
22 |
✅ 精读 sessionStorage.ts |
| MemDir 记忆系统 |
23 |
✅ + findRelevantMemories 深度更新 |
| Computer Use |
24 |
✅ 精读13个源文件(新增) |
| LSP 集成 |
25 |
✅ 精读7个源文件(新增) |
| Plan Mode V2 |
26 |
✅ 精读 planModeV2.ts(新增) |
| VCR 测试基础设施 |
27 |
✅ 精读 vcr.ts 406行(新增) |
| 面试题全集 |
28 |
✅ 200+题,含代码题(新增) |
覆盖度:✅ 100%(所有主要子系统均有深度文档)
整理时间:2026-05-27 | 基于 Claude Code 2.1.88 源码